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“一 带 一 路 "倡议 下 的 Twitter 文本 主题 榨 据 和 情感 分 析 ” 
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摘要 : [目的 /意义 ]“ 一 带 一 路 ”倡议 的 提出 引起 了 国内 外 广泛 的 关注 ,众多 国家 的 用 户 在 最 具 代表 性 的 社 
交 媒 体 Twitter 中 表达 观点 、 发 表 评 论 、 相 互 讨论 。 从 推 文中 挖掘 得 出 世界 对 “一 带 一 路 ”的 讨论 主题 和 情感 倾 
向 ,有 助 于 为 政府 机 构 优 化 宣传 策略 ,增加 “一 带 一 路 ”倡议 的 曝光 度 、 关 注 度 提供 参考 。[ 方 法 /过 程 ] 采 集 
2017 年 与 “一 带 一 路 ”相关 的 6 万 余 条 推 文 ,分 别 按照 中 文 和 英文 进行 数据 预 处 理 、 数 据 描述 .主题 挖 气 、 情 感 
分 析 , 并 实现 主题 和 情感 的 交 又 分析, 得 出 结论 。[ 结果/ 结论] 2017 年 的 推 文 主题 主要 围绕 5 月 份 的 “一 带 一 
路 ”高 峰 论坛 。 其 中 ,中 文 推 文 更 关注 高 峰 论 坛 的 筹划 和 实施 ,以 及 安全 问题 ,领导 层 的 访问 等 方面 的 内 容 , 情 
感 值 的 波动 较 大 ,特别 是 安全 问题 上 的 消极 情绪 波动 很 大 。 英 文 推 文 则 更 关注 举办 高 峰 论坛 的 事实 以 及 论坛 


质 带 来 的 经 济 效应 ,情感 波动 较 小 ,经 济 方面 的 情感 值 是 积极 占 比 明显 高 于 消极 和 中 立 的 情感 值 


〇 关键 词 :“ 一 带 一 路 ”Twitter 
分 类 号 : TP391.1 
© DOIL:10. 13206/j. issn. 0252 -3116.2019.19.012 


主题 挖 握 


情感 分 析 


2013 年 9 月 和 10 月 ,中 国 国家 主席 习近平 先后 提 


带 一 路 ”倡议 的 宣传 报道 提供 参考 。 


| 内 全 建 “ 丝 绸 之 路 经 济 带 ”" 和 “21 世纪 海上 丝绸 之 路 ” 
(区 下 简称 “一 带 一 路 ” ) 倡议 ,受到 了 国际 上 的 高 度 关 
湛 \ 得 到 了 有 关 国家 的 积极 响应 。 社 交 媒体 是 人 们 获 
取 粮 息 的 重要 来 源 和 表达 观点 .相互 交流 的 重要 窗口 。 
合作 ,社交 媒体 不 再 仅 聚 焦 于 人 的 生活 、 娱 乐 ,在 政策 
观 喇 的 宣传 方面 也 体现 出 越 来 越 重 要 的 作用 ,逐渐 承 
担 参 政工 具 、 商 业 广告 平台 .讨论 社区 等 角色 。 美 国 总 


= 


1 相关 研究 


1.1 围绕 “一 带 一 路 ”的 研究 现状 

截至 2018 年 4 月 ,中 国 知 网 共有 4 万 多 篇 “一 带 
一 路 ”相关 文章 ,涉及 政策 分 析 、 经 济 效应 分 析 、 科 研 合 
作 分 析 等 多 方面 。 其 中 ,文本 分 析 相 关 的 文 草 于 2015 
年 首次 发 表 ,数量 较 少 ,多 数 以 新 闻 媒体 报道 为 研究 对 


统 等 朗 普 常 在 国外 社交 媒体 中 宣传 自己 的 政策 .发表 
与 政治 活动 相关 意见 ,有 些 话题 引起 了 广泛 的 社会 与 
论 。Twitter 作为 一 种 微 博 客 型 社交 媒体 , 至 2017 年 
底 , 已 支持 中 文 .英文 等 全 球 34 种 语言 ,累积 激活 用 户 
数量 达到 3.6 亿 , 包 括 政治 、 体 育 、 娱 乐 等 多 个 领域 的 
领 凑 人 物 。 众 多 国家 用 户 在 Twitter 上 对 “一 带 一 路 ” 
倡议 展开 了 热烈 的 讨论 ,2017 年 全 年 共有 10 万 余 条 相 
关 推 文 。 在 这 一 背景 下 ,政府 机 构 如 何 合理 利用 社交 


象 ,涉及 《中 国 日 报 * 非洲 版 《华盛顿 邮 报 》 等 ,挖掘 
得 出 语义 结构 特征 .主题 观点 。 如 黄 炎 秋 基于 《中 国 日 
报 : 非洲 版 》 文 本 数据 ,讨论 了 公共 外 交 与 传播 新 常态 
矛盾 等 问题 ,分 析 过 程 中 发 现 了 “一 带 一 路 ”议题 摆脱 
了 “一 边 倒 "的 现象 ,成 为 了 国际 性 话题 ,最 后 为 宣传 
报道 提出 了 策略 和 建议 ，。 朱 桂 生 等 学 者 利用 了 美国 
的 《华盛顿 邮 报 文本 数据 ,对 “一 带 一 路 ”主题 下 相关 
报道 进行 了 批评 性 话语 分 析 , 从 文本 ,话语 实践 和 社会 


媒体 ,加 大 国家 倡议 的 宣传 力度 ,增加 曝光 度 ,激发 更 
多 的 讨论 十 分 必要 。 基 于 此 ,本 文 运用 多 种 方法 从 推 
文 评论 数据 挖掘 人们 对 “一 带 一 路 ”倡议 的 讨论 主题 
和 情感 倾向 ,得 出 交叉 性 结论 ,以 丰富 相关 研究 ,为 "一 


实践 3 个 层面 人手 ,揭示 了 美国 媒体 把 中 国 的 “一 带 一 
路 ”倡议 塑造 成 了 一 种 殖民 扩张 . 重 利 轻 义 的 霸权 形 
象 ”。 着 眼 于 社交 媒体 文本 的 相对 较 少 ,国内 数据 源 
主要 基于 新 浪 微 博 开 展 , 如 采集 2013 - 2016 年 约 36 
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万 条 新 浪 微 博 文本 数据 ,利用 空间 自 相关 分 析 方 法 ,证 
明 核心 城市 和 边缘 城市 之 间 的 倡议 响应 差异 ,提出 了 
优化 宣传 空间 结构 等 建议 外。 国外 数据 源 主要 基于 
Twitter 开展 ,如 采集 2015 年 “一 带 一 路 ” 主题 下 2 000 
余 条 推 文 ,进行 地 域 划 分 和 关键 词 统计 ,分 析 信 息 传递 
过 程 “。 然 而 目前 的 研究 局 限于 结构 化 的 传统 新 闻 文 
本 ,存在 数据 量 较 少 .数据 来 源 比较 单一 .分析 维度 较 
少 等 不 足 。 
1.2 主题 挖掘 方法 研究 进展 

主题 挖掘 是 利用 文本 集合 中 文本 特征 项 之 间 的 关 
联 关系 发 现 研究 主题 的 过 程 。 分 析 主 题 在 时 间 维 度 上 
的 演化 分 析 ,可 以 明确 主题 发 展 脉络 ,寻找 创新 点 。 传 
统 的 主题 控 据 方法 主要 有 词 频 分 析 法 、. 共 词 分 析 法 和 
引 奖 分 析 法 等 。 词 频 分 析 法 是 基于 齐 普 夫 定 律 , 通 过 
关键 词 或 主题 词 的 出 现 频次 来 确定 主题 的 方法 。 昌 简 
彰 乙 用 ,但 高 频 词 和 低频 词 具 有 非常 强 的 主观 性 ,会 导 
焉 里 题 范围 比较 广 ,主题 难以 归 一 等 问题 。 共 词 分 析 
夫 囊 基于 统计 思想 ,查看 两 个 关键 词 在 同一 篇 文献 中 
的 共 现 关系 ,兼顾 了 词 频 和 词 与 词 之 间 的 关系 ,但 低频 
启 布 易 被 纳入 到 主题 的 讨论 之 中 。 引 文 分 析 法 是 基于 
张力 和 被 引用 的 关系 ,通过 引用 率 .引用 耦合 和 同 被 引 
等 独 标 进行 主题 划分 ,但 面临 着 引用 关系 复杂 、 引 用 格 
式 从 统一 等 问题 。 整 体 来 看 ,传统 的 主题 演化 分 析 方 
法 秘 易 操作 ,应 用 比较 广 ,但 主观 性 较 强 , 研究 结论 
fe 


上 = 之 后 出 现 了 结合 机 器 学 习 和 自然 语言 处 理 的 复杂 
模型 ,LSI、PLSI' .LDA 等 都 属于 这 个 范畴 。 隐 含 狄 利 
区 二 分 布 模型 (Latent Dirichlet Allocation ，LDA ) 是 D,， 
M. Blei 等 “在 2003 年 提出 的 确定 一 组 文档 的 共同 主 
题 的 技术 ,认为 一 篇 文章 的 每 个 词 都 是 通过 “以 一 定 概 
率 选 择 了 某 个 主题 ,并 从 这 个 主题 中 以 一 定 概率 选择 
某 个 词 " 的 方式 得 到 主题 分 类 '”。2010 年 前 后 有 学 者 
将 LDA 模型 应 用 于 社交 媒体 上 ,M，Michelson 等 ” 利 
用 LDA 模型 研究 Twitter 用 户 所 关注 的 主题 内 容 ,Y. S. 
Hwang 等 利用 LDA 主题 模型 研究 了 意见 领袖 讨论 
主题 的 规律 和 方法 。Y. Hu 等 ”应 用 LDA 模型 分 析 
时 事 新 闻 的 社交 媒体 评论 数据 ,得 出 用 户 观 点 。 随 后 
又 出 现 了 基于 PLSA 和 LDA 的 改进 模型 。 如 Q. Mei 
等 器 对 PLSA 模型 进行 了 改良 ,将 词语 的 上 下 文 的 信 
息 应 用 到 PLSA 模型 上 , 称 为 CPLSA (Contextual Proba- 
bilistic Latent Semantic Analysis) ,S. Moghaddam 等 “1 提 
出 的 增 量 潜在 狄 利克 雷 分 类 (ILDA) ,在 LDA 模型 的 
基础 上 ,添加 文本 特征 参数 ,提高 了 主题 聚 类 的 准确 
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性 ,主要 应 用 于 从 评论 中 抽取 主题 及 得 分 。 此 外 ,还 出 
现 了 动态 主题 模型 (DTM) 5 和 在 线 潜在 狄 利克 雷 分 
类 (OLDA) 9 等。 可 见 众多 学 者 对 LDA 模型 进行 了 
广泛 .深入 的 研究 ,模型 得 到 了 较 好 的 发 展 ,因此 ,本 文 
选取 LDA 的 方法 进行 推 文 的 主题 挖掘 。 
1.3 ”情感 分 析 方 研究 进展 

情感 分 析 是 从 文本 数据 中 识别 出 用 户主 观 的 情 
感 .观点 和 态度 的 过 程 。 在 奥 情 监控 和 信息 预测 等 
方面 应 用 较 广 。 最 初 的 社交 媒体 情感 分 析 就 是 基于 
Twitter 的 社交 媒体 数据 开展 的 。J.，Bollen 等 
基于 Twitter 数据 把 情感 分 成 6 个 情感 维度 ,分 析出 了 
每 天 最 具 代表 性 的 情感 ;P. S. Dodds 等 ”从 情感 分 析 
的 角度 尝试 解释 了 人 们 感到 幸福 的 规律 。 情 感 分 析 方 
法 主要 可 分 为 基于 情感 词典 的 情感 分 析 方法 和 基于 机 
器 学 习 的 情感 分 析 方法 。 基 于 情感 词典 的 情感 分 析 是 
从 待 测 文本 中 提取 特征 词 后 ,在 情感 词典 中 查找 该 特 
征 词 的 情感 值 ,根据 累加 的 情感 值 进行 情感 分 类 的 方 
法 。 在 情感 词典 的 选择 上 ,一 般 有 两 种 方式 :一 种 
试 引用 已 有 的 情感 词典 , 如 HowNet 词典 、Senti- 
WordNet Inquirers 等 ; 另 一 种 是 通过 研究 数据 自行 
构建 词典 ,如 R. Feldman 等 ”学 者 在 已 有 的 情感 词 
典 的 基础 上 ,利用 部 分 人 工 标 注 和 Bootstrapping 的 方 
式 提取 情感 词 。 基 于 机 器 学 习 的 情感 分 析 方 法 则 先 基 
于 文本 集训 练 得 到 分 类 器 ,再 基于 分 类 器 实现 对 新 文 
本 的 分 类 ”“ 。 随 着 人 工 智能 和 深度 学 习 的 发 展 ,不 少 
学 者 把 深度 学 习 的 技术 运用 到 情感 分 析 中 。B. Pang 
等 ”首次 利用 机 器 学 习 的 方法 对 电影 的 评论 文本 做 
了 情感 分 析 。 张 志 华 “ 在 情感 词 向 量 的 基础 上 利用 
卷 积 神经 网 络 模型 进行 情感 分 析 , 通 过 英文 文本 做 了 
实证 研究 ,结果 显示 基于 深度 学 习 模 型 的 分 类 结果 占 
一 定 的 优势 。 

然而 对 于 非 结构 化 的 文档 ,如 微型 博客 ,社交 媒体 
等 ,基于 机 器 学 习 方法 的 分 类 效果 并 不 理想 。 由 于 推 
文 限 制 在 140 个 字 以 内 ,长 度 较 短 , 通 常 表达 1 - 2 个 
句子 ,其 中 包含 表达 情感 的 情感 符号 和 网 络 用 语 , 机 器 
学 习 的 方法 对 这 些 符号 和 用 语 相 对 不 敏感 。 基 于 机 器 
学 习 的 情感 分 析 还 需要 依赖 大 量 语 料 的 训练 和 人 工 干 
预 , 耗 时 间 比 较 长 ,因此 本 文 对 推 文 的 处 理 选用 基于 情 
感 词典 的 情感 分 析 方 法 。 


2 ， 推 文 主题 挖掘 和 情感 分 析 方 法 
2.1 主题 挖掘 方法 
文章 基于 LDA 主题 模型 算法 挖 据 主题 。 目 前 普 


[一 
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人 遍 认 为 应 用 LDA 的 最 关键 的 在 于 最 佳 主题 数目 的 确 
定 ,LDA 主题 抽取 的 效果 和 潜在 主题 数目 有 直接 关 
系 ”。 国 内 外 学 者 提出 了 最 小 困惑 度 算法 、HDP 算 
法 、 贝 叶 斯 算法 等 多 种 确定 最 优 主题 数量 的 方法 。 
综合 考虑 ,本 文采 用 由 R. Michael 等 2015 年 提出 来 的 
Coherence 方法 作为 评价 模型 好 坏 的 评价 标准 ,通过 选 
取 Coherence 最 大 的 模型 来 确定 主题 的 最 佳 数 目 。 主 
题 挖掘 的 流程 如 图 1 所 示 , 经 过 数据 预 处 理 、 分 词 后 ， 
建立 词 频 特 征 构建 文档 -单词 矩阵 ,利用 Coherence 值 
确定 最 佳 的 主题 数目 ,构建 LDA 模型 ,挖掘 得 出 主题 。 


1. 数 据 ) 分局 3. 构 建 


1 主题 挖掘 流程 


2. 2s 情感 分 析 方法 

人 应 用 基于 情感 词 册 的 情感 分 析 方法 时 ,本 文 在 现 
古 的 研究 基础 上 ,构建 和 扩充 了 情感 词典 。 针 对 中 文 
扒 灵 和 英文 推广 ,分别 采用 了 如 下 方法 

一 (1) 中 文 推 文 的 情感 分 析 基 于 大 连理 工大 学 情感 
鹿 汇 本 体 库 对 情感 词 进行 扩充 。 大 连理 工 情 感 词汇 本 
僵硬 将 情感 分 为 " 乐 ,好 、 怒 、 哀 , 惧 \ 恶 , 惊 ?7 类 ,并 定 
这 六 情感 的 强度 ,但 未 涉及 情感 词 在 句子 中 与 程度 副 
证 得 定 词 表情 符号 等 之 间 的 关系 。 然 而 在 中 文句 式 
中 5 不仅 否定 词 和 程度 副词 在 情感 词 的 前 后 位 置 关系 
会 野 响 情感 强度 ,而 且 否 定 词 的 出 现 次 数 也 会 影响 整 
体 情 感 值 。 笔 者 综合 考虑 句子 中 否定 词 程度 副词 对 
情感 词 的 作用 ,分 别 构建 否定 词 词典 和 程度 副词 词典 ， 
借 蛙 杨 希 P 的 6 种 情感 词组 合 方法 ( 见 表 1) ,综合 
虑 铝 定 词 .程度 副词 之 间 的 相互 作用 ,计算 推 文 的 情感 
值 。 


表 1 情感 词组 合 模 式 


序号 情感 词句 式 

1 [情感 词 ] 

2 [ 否定 词 ] + [情感 词 ] 

3 [程度 副词 ] + [情感 词 ] 

4 [ 否定 词 ] + [程度 副词 ] + [情感 词 ] 
5 [程度 副词 ] + [否定 词 ] + [情感 词 ] 
6 [否定 词 ] + [否定 词 ] + [情感 词 ] 


在 计算 每 条 推 文 情感 值 时 ,以 每 个 情感 词 为 基准 ， 

发 现 否 定 词 和 程度 副词 的 位 置 关系 ,累加 文本 中 的 情 
感 值 , 7 个 维度 情感 计算 公式 如 下 : 

Erm:= Yoe*" (-1)".P 公式 (1) 

其 中 ,i 表示 七 大 情感 类 别 中 的 某 一 类 ,Eiw ;表示 


一 条 推 文 在 i 类 的 情感 值 ,K 表示 一 条 推 文中 出 现 的 
所 有 情感 词 个 数 ,ei 表示 一 个 情感 词 在 i 类 上 的 情感 
强度 ,N 表示 与 该 情感 词 相关 的 否定 词 个 数 ,P 表示 程 
度 副词 的 加 权 值 。 

(2) 英文 推 文 的 情感 分 析 基 于 Wordnet 构建 的 
SentiwordNet3.0 对 情感 词典 进行 扩充 。SentiwordNet3.0 
目前 包含 117 659 个 词 。 利 用 随机 漫步 模型 ,为 每 个 
Synset 下 的 词典 予 了 PosScore( 正 向 情感 值 ) 和 Neg- 
Score( 负 向 情感 值 ) 。 英 文 情 感 分 析 同 样 构建 否定 词 
和 程度 副词 词典 ,并 使 用 在 中 文 情感 分 析 过 程 中 构建 
的 表情 符号 词典 。 每 条 英文 推 文 的 情感 值 计算 公式 如 
下 : 


忆 =2-oew，(-1)”， P+Pos-Neg 
公式 (2) 

其 中 ,E 表示 一 条 英文 Twitter 的 正 向 或 负 向 情感 
值 ,K 表示 一 条 推 文 中 出 现 的 所 有 情感 词 个 数 ,e,, 表 示 
一 个 情感 词 在 正 向 和 负 癌 的 情感 强度 ,N 表示 与 该 情 
感 词 相关 的 否定 词 个 数 ,P 表示 程度 副词 的 加 权 值 ， 
Pos 表示 积极 表情 符号 个 数 ,Neg 表示 消极 表情 符号 个 
数 。 

(3) 为 了 更 明确 地 呈现 推 文 的 情感 倾向 ,计算 每 
条 推 文 三 元 情感 极 性 。 三 元 情感 极 性 即 积极 .中立 、 消 
极 ,具体 计算 公式 如 下 : 

E,= 30e,.(—-1)"+Pos-Neg 公式 (3) 

其 中 ,E, 表示 一 条 推 文 的 情感 极 性 ,1 表示 积极 .0 
表示 中 立 、-1 表示 消极 。 在 i 类 的 情感 值 ,e, 表示 一 
个 情感 词 的 极 性 ,NN 表示 与 该 情感 词 相关 的 否定 词 个 
数 ,Pos 表示 积极 表情 符号 个 数 ,Neg 表示 消极 表情 符 
号 个 数 。 
2.3 ”主题 一 情感 交叉 分 析 

主题 一 情感 分 析 是 结合 主题 挖掘 和 情感 分 析 的 结 
果 ,得 到 不 同 主题 下 的 情感 倾向 随时 间 变 化 的 趋势 。 
具体 实现 过 程 为 :通过 主题 挖掘 得 出 每 一 条 推 文 的 主 
题 概 率 分 布 ,通过 情感 分 析 得 出 每 条 推 文 在 不 同 主题 
下 的 情感 值 ,按照 主题 进行 累加 计算 ,最 终 得 出 随时 间 
不 同 主题 下 的 情感 值 变化 。 


3 ”实证 研究 


3.1 推 文采 集 与 数据 概况 

以 “One Belt One Road”“OBOR” 和 “一 带 一 路 ”3 
个 关键 词 为 限定 词 , 共 采 集 到 2017 年 1 月 1 日 -12 月 
31 日 间 102 029 条 相关 推 文 ,数据 样 例如 表 2 所 示 : 
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表 2， 推 文 数据 爬 取 结果 ( 样 例 ) 


回复 ”转载 点 鞠 


账号 发 布 时 间 推 文 数 数 数 


#China s One Belt One 
31 -Dec -17 册 0 


futures Road projects in … 


为 保证 实验 结果 的 准确 性 ,删除 由 于 Twitter 模糊 
检索 带 来 的 低 相 关 性 数据 及 法 文 .西班牙 文 等 其 他 语 
种 数据 ,最 终 保留 了 63 907 条 推 文 进行 深入 分 析 , 其 
中 中 文 文本 为 11 457 条 ,英文 文本 为 52 450 条 ,由 
23 706 个 Twitter 用 应 发 出 。 这 些 用 户 来 自 于 不 同 的 地 
区 ,其 身份 也 不 同 。 已 知 的 地 域 信息 中 ,美国 和 加 拿 大 
的 北美 地 区 用 户 占 18% ,印度 尼 西亚 雅加达 占 8% , 马 
来 西亚 吉隆 坡 占 4% ,中 国 北京 占 4% 。 从 采集 到 的 用 
户 数据 来 看 ,用 户 可 以 分 为 媒体 .记者 ,政治 家 、 专 家 、 
拥 史 者 、- 般 个 人 用 户 等 类 型 ,并 表现 出 如 下 特征 : 媒 
体型 用 户 在 抛 出 话题 ,记者 型 和 政治 型 .专家 型 一 般 

型 用 户 共同 推动 话题 的 讨论 ,拥护 者 一 向 发 表 支 
振 或 积极 的 观点 。 从 发 文 数量 来 看 ,媒体 型 的 账号 发 
光量 大 于 个 人 账号 。2017 年 “一 带 一 路 "主题 下 月 度 
氛 文 数量 分 布 情况 如 图 2 所 示 ; 


000 
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四 只 000 


@ water_ 
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4983 3853 3404 3784 4019 3629 


0 
CC 1 月 2 月 3 月 4 月 5 月 6 月 7 月 8 月 9 月 10 月 11 月 12 月 


CS 月 份 
“一 带 一 路 ”主题 下 月 度 推 文 数量 分 布 
可 以 看 出 ,2017 年 1 -4 月 “一 带 一 路 "主题 推 文 
数量 稳 中 有 升 ; 5 月 中 国 举办 了 ”一带 一 路 "国际 合作 
高 峰 论 坛 ,相关 话题 量 大 幅 上 升 ,达到 峰值 ;6 月 推 文 
数量 锐 减 ,随后 较为 平稳 ,但 整体 水 平 较 1-4 月份 有 


还 原 。 完 成 分 词 后 ,提取 中 ,英文 的 推 文中 的 名 词性 词 
语 ,根据 词 频 得 到 推 文 词 云 ,如 图 3 所 示 : 
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图 3 “一 带 一 路 "主题 下 中 、 英 文 推 文 词 云 


可 以 看 出 ,中 文 的 词 频 明 显 大 于 英文 的 词 频 , 高 频 
词语 多 数 与 “一 带 一 路 "高 峰 论坛 相关 ,排名 前 十 的 
中 .英文 高 频 词 如 表 3 所 示 : 

表 3 中、 英文 推 文 词 频 统计 


中 文 英文 

排名 - 
词汇 词 频 词汇 词 频 

1 一 带 一 路 11 426 onebeltoneroad initiative 984 
2 中 国 3 499 new silk road 403 
3 合作 1 672 onebeltoneroad project 309 
4 国际 3 onebeltoneroad summit 236 
5 国家 1 282 pakistan 227 
6 高 峰 论 坛 1 181 china 314 
7 北京 1 096 central asia 208 
8 建设 834 silk road 193 
9 经 济 727 economic corridor 182 
10 发 展 708 sri lanka 156 


3.3 ”主题 挖掘 结果 

通过 实验 分 别 计算 中 文 推 文 3 -15 个 主题 下 的 
Coherence 值 , 找 出 该 值 最 大 的 主题 数 ,作为 LDA 最 佳 
主题 数目 。 3 当主 题 数 为 6 时 ,Coherence 值 


所 上 升 ,一 定 程度 上 反映 了 5 月份“ 一带 一 路 ”国际 合 
作 高 峰 论坛 的 举办 ,引起 了 Twitter 用 户 对 “一 带 一 路 ” 
的 高 度 .集中 的 关注 ,带动 了 后 几 个 月 对 ”一带 一 路 ” 
话题 的 讨论 。 

为 了 提高 中 文 推 文 的 分 词 精度 ,收集 与 “一 带 一 
路 "相关 的 360 篇 官方 新 闻 报 道 ,利用 “新 词 发 现 ” 和 


TF-IDF 算法 ,提取 每 篇 报道 的 主要 关键 词 ,得 到 自 定 
义 分 词 词典 , 共 包 含 8 242 个 词 。 利 用 结巴 分 词 工具 


进行 分 词 。 对 于 英文 推 文 ,采用 词 形 还 原 的 方法 ,考虑 
一 个 词 在 文章 中 的 词性 (Part-of-speech ) 再 对 单词 进行 
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最 大 ,因此 中 文 推 文 主题 数 定 为 6。 基 于 LDA 模型 分 
析 得 出 “一 之 一 路 ”与 朝鲜 半岛 和 平 问题 “一 带 一 路 ” 
与 经 济 问题 “一 带 一 路 ”与 高 峰 论 坛 之 高 层 访问 “一 
带 一 路 ”与 高 峰 论坛 之 合作 与 项 目 “ 一 带 一 路 "与 外 
交战 略 “ 一 带 一 路 "与 国内 热点 , 共 六 大 中 文 推 文 热 
议 主题 ,其 相关 的 关键 词 分 别 见 表 4。 

“一 带 一 路 ”与 朝鲜 半岛 和 平 问 题 主 题 ,凸显 了 
2017 年 4 月 29 日 朝鲜 试 射 导弹 带 来 的 紧张 的 周边 局 
势 ,周边 国家 如 韩国 、 俄 罗斯 十 分 关注 ,也 说 明了 一带 
一 路 ”的 发 展 一 定 程度 上 依赖 于 周边 国际 环境 。 一 


赵 常 煜 , 吴 亚 平 , 王 继 民 ,. 
7 


“一 带 一 路 "倡议 下 的 Twitter 文本 主题 


总 分 析 []] 图 书 情 报 上 由 9 入 i 合作 期 刊 


宅 据 和 情 


表 4 2017 年 中 文 推 文 主题 挖掘 结果 


关键 词 


题 工作 代表 、 俄 罗斯 生态、 作者 .时事 等 
一 带 一 路 ”与 经 济 问题 一 带 一 路 ,中国 ,建设 会见、 金融 .国家 、 李 克 强 .峰会 .总理 、 股 市、 


币 \ 俄 罗斯、 领导 人 等 


一 带 一 路 "与 朝鲜 半岛 和 平 问 ”一 带 一 路 国际、 朝鲜 导弹 、 韩 国 . 团 长 ,文明 安保 \ 局 势 、 社 会 发展 ,全 球 、 和 平 、 


El 


有 


资 委 .朝鲜 半 岛 建设、 能量 


合作 发展. 老百姓. 宣传、 经济、 人民币 ,资金 .美国 、 货 


带 一 路 ”与 高 峰 论 坛 之 高 层 带 一 路 .中 国 、 国 际 \ 高 峰 论坛 、 国 家 北京 .美国 倡议 .主席 发展, 论坛 ,总 统 、 会 议 . 印 度 .日 本 代表、 领导 人 、 普 京 . 峰 
访问 会 协议 等 
一带 一 路 "与 高 峰 论坛 之 合作 带 一 路 .经济 峰会. 建设、 国家 发展 合作、 全 球 化 圆桌 \ 市 场 、 投 资 ,政治 .战略 .菲律宾 新西兰. 欧洲 、 智 库 . 巴 基 芍 
与 项 目 坦 教育 文化 等 
一 带 一 路 ”与 外 交战 略 一 带 一 路 中国、 宪章 国家 投资 政权 大 陆 、 合 作 挑战 .声明 政策 .铁路 .基础 设施 、 会 见 ` 外 交 部 .世界 、 贸 易 、 机 遇 、 国 


| 
繁 
HL 
2 
济 
ES 
卫 
也 
图 


TYAA 


让 、 国 家 湖北 广西 ,李克强 ,政府 浙江、 卫星 . 电 商 、 


建设 山东、 人 全国、 新 闻 等 


带 一 路 "与 经 济 主题 ,凸显 了 经 济 发 展 .金融 合作 的 重 
要 工作 "一带 一 路 "为 人 民 币 的 国际 化 带 来 了 机 遇 ， 
dla he 第 三 个 
人 一 带 一 路 ” 高峰 论坛 的 高 
间 和 合作 与 项 目 方面 ,凸显 了 国际 的 关注 与 多 个 
国 汝 元 首 的 参与 以 及 峰会 推动 的 政治 .投资 .教育 . 文 
信和 多 方面 的 全 球 化 合作 。" 一 带 一 路 "与 外 交战 咯 
韦 题 ,凸显 了 基础 设施 铁路 .贸易 .投资 等 重要 外 交 领 
er 
确 居 同时 面临 机 过 和 挑战 。" 一 带 一 路 ”与 国内 热点 ， 


加 


= 


凸显 了 北京 等 国内 省 ,市 的 积极 响应 
商 “ 走 出 去 ”创造 了 机 遇 。 

计算 英文 推 文 随 主题 数 变化 的 Coherence 值 ,实验 
得 出 当主 题 数 为 4 的 时 候 , Coherence 值 取得 最 大 为 
0.79 ,因此 限定 主题 数 为 4 进行 LDA 主题 挖掘 ,基于 
LDA 模型 分 析 得 出 “一 带 一 路 ”与 CPEC、“ 一 带 一 路 ” 
与 对 外 合作 “一带 一 路 ”与 经 济 效应 “一 带 一 路 ”与 
对 外 政策 , 共 四 大 英文 推 文 热 议 主题 ,其 相关 的 关键 词 
分 别 如 表 5 所 示 : 


,为 更 多 的 国内 电 


二 2 
© 表 5 2017 年 中 文 推 文 主题 挖 据 结果 
日 二 、 、 一 
是 主题 关键 词 
= 
BB 一带 一 一 路 ”与 CPEC china cpec ,global economy .pakistan ,onebeltoneroad project .grand strategy \regional connectivity ,official cpec beltandroad summit long- 
>< erm strategy .china relation \infra project 等 
局 稚 与 对 外 合作 infrastructure project india japan ,44bil project\sino indian relation .chinese firm ,economic growth plan russia \international airport for- 
= eign policy plan 等 
B= 


= 和- 带 一 路 "与 经 济 效应 


。 ”局 
cial express .economic cooperation 等 


Di 一路" 与 对 外 政策 


“一 带 一 路 ”与 CPEC 主题 下 ,CPEC 是 中 国 一 巴 基 
斯 坦 经 济 走 亡 (China -Pakistan Economic Corridor ) 的 缩 
写 ,被 称 为 贯穿 南北 丝绸 之 路 的 枢纽 ,以 加 强 中 巴 之 间 
交通 能源 海洋 等 领域 的 交流 与 合作 ,促进 共同 发 展 。 
中 国 石 油 天 然 气 公司 是 中 巴 天 然 气管 道 的 建设 的 重要 
力量 ,为 区 域 联通 和 更 长 远 的 战略 合作 做 了 良好 的 示 
范 。“ 一 带 一 路 "与 对 外 合作 主题 ,再 次 凸显 了 基础 设 
施 合作 的 重要 性 ,俄罗斯 .印度 等 合作 国家 及 国际 关系 
受到 了 更 多 的 讨论 “一 带 一 路 "与 经 济 效应 主题 ， 
显 了 全 球 电力 全球 贸易 经济 a 联合 联通 等 “一 

一 路 ” 全球 化 发 展 的 经 济 蓝图 。 i 
策 主题 , 则 涉及 “新 丝绸 之 路 “经 济 走 廊 ” 等 整体 性 外 
交 倡 议 以 及 区 域 间 合作 政策 等 ,受到 了 广泛 关注 与 热 
议 。 


onebeltoneroad initiative .eastern europe 、global power economic development .model project joint connectivity project global trade \finan- 


road initiative new silk road .china pakistan ,central asia \foreign policy ,economic corridor primary focus foreign affair .chinese investment 等 


3.4 

过 情感 极 性 判断 文本 的 肯定 .否定 ,中立 三 元 情 
ee 
主题 下 每 月 中 文 推 文 三 元 情感 分 析 结果 如 图 4 所 示 : 
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图 4 2017 年 “一 带 一 路 ”主题 下 每 月 中 文 


推 文 三 元 情感 分 析 结 果 
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从 趋势 上 来 看 ,中 文 用户 对 “一 带 一 路 ”的 态度 中 
积极 和 中 立 均 高 于 消极 。1 -7 月 中 立 居 高 ,8 月 份 为 
转折 点 ,从 9 月 份 后 用 户 中 立 的 情感 逐渐 分 明 ,积极 情 
感 稳步 直线 上 升 ,在 12 月 份 达到 最 高 ,为 0.48。 消 极 
情感 也 有 少量 增加 且 趋 于 稳定 。 

英文 推 文 的 情感 分 析 结 果 如 图 5 所 示 : 


0.54 0.53 0.54 
0.52 0 so 0.52 


0.50 
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0.38 0.39 
040 | 037 036 034 036 037 034 035 0.36 


相 比 来 看 ,英文 推 文中 表现 的 情绪 比较 稳定 ,全 年 
中 立 、 积 极 、 消 极 的 情感 值 平 均值 分 别 为 0.51 .0. 37、 
0.12。5 月 份 举行 高 峰 论 坛 前 后 的 情感 变化 不 大 ,10 月 
份 十 九 大 的 召开 得 到 了 外 媒 的 关注 ,高峰 论坛 的 举办 
凸显 了 一 带 一 路 ”的 影响 力 , 其 发 展 再 上 新 台阶 , 正 
是 在 10 月 份 ,情感 值 有 明显 的 转折 点 ,情感 倾向 更 加 
明确 ,积极 情感 一 直 稳 中 有 升 ,在 12 月 超越 了 中 立 的 
情感 占 比 ,消极 情感 也 有 相对 较 少 的 小 幅 上 升 。 


5 六 3.5 主题 情感 交叉 与 演化 分 析 
比 ~ yy YELMA DY yy c= 
o20 | og O11 012 oa 013 014 olz 010 013 014 随 着 时 间 的 推移 ,用 户 讨 论 话题 在 不 断 变 化 ,不 同 
\ V .09 和 . = . 这 
010 me 主题 下 的 情感 值 也 在 变化 。2017 年 中 文 推 文 主题 的 
0 2 月 3 月 4 月 5 月 6 月 7 月 8 月 9 月 10 月 11 月 12 月 情感 演化 结果 见 图 6。 
2 可 以 看 出 ,“' 一 带 一 路 "与 朝鲜 半岛 和 平 问 题 ” 主 
下 积极 -四 -消极 一 一 中立 a 、 i 
qT 题 的 情感 波动 比较 大 , 4-6 月 和 8 -9 月 ,消极 的 情感 
已 图 5 2017 年 "一带 一 路 "主题 下 每 月 值 明显 上 升 ,这 一 变化 的 原因 推测 可 能 与 以 下 几 点 有 
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OO 07 06 
66 0.6 0.5 
hs; 0.5 04 
OO 04 
网 0.3 l 
C9 02 02 
oy 0.1 0.1 
0 0 0 
CN 1 月 2 月 3 月 4 月 5 月 6 月 7 月 8 月 9 月 10 月 11 月 2 月 1 月 2 月 3 月 4 月 5 月 6 月 7 月 8 月 9 月 10 月 11 月 2 月 1 月 2 月 3 月 4 月 5 月 6 月 7 月 8 月 9 月 10 月 11 月 2 月 
一 -积极 天 -消极 -中 立 一 积极 -四 消极 一 上 中 立 一 全 积极 于 -消极 到 -中 立 
> 
0 高 峰 论 坛 之 合作 与 项 目 外 交战 略 内 热点 
> 0.8 0.7 
Ss 69 


0.6 
0.5 
04 
0.3 


2 02 0.2 
1 01 0.1 PD 
0 


1 月 2 月 3 月 4 月 5 月 6 月 7 月 8 月 9 月 10 月 11 月 2 月 


一 -积极 到 -消极 下 中立 


1 月 2 月 3 月 4 月 5 月 6 月 7 月 8 月 9 月 10 月 1 月 2 月 
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下 积极 -全 消极 下 中 立 


图 6 中 文 推 文 主题 在 不 同月 份 ( 横 轴 ) 的 情感 类 型 占 比 ( 纵 轴 ) 变化 


界 各 国 的 谨 责 ,中 国政 府 也 对 朝鲜 表示 遗憾 和 反对 ; 朝 
鲜 导弹 问题 ,除了 9 月 份 的 核 试验 之 外 ,2、3 4,9、11 月 
朝鲜 发 射 了 导弹 导致 了 朝鲜 半岛 周围 的 紧张 局 势 。 
”一 带 一 路 "与 经 济 问题 " 主题 的 积极 情感 值 从 3 月 
份 到 年 底 一 直 高 于 中 立 和 消极 ,到 了 年 底 积极 情感 值 
的 占 比 超过 50% 。“ “一 带 一 路 "与 高 峰 论坛 之 高 层 访 
问 ”" 和 “ “一带 一 路 "与 高 峰 论 坛 之 合作 与 项 目 ” 两 个 
主题 都 与 高 峰 论坛 相关 ,高 层 访问 相关 主题 在 6 月 份 
出 现 了 消极 的 峰值 ,6 月 份 日 本 首相 安培 表示 日 本 加 
入 "一带 一 路 "大 计划 当中 ,不 少 中 文 推 文 用 户 对 此 表 
示 了 一 定 的 反对 。 合 作 方 面 , 持 积极 和 中 立 态度 的 用 
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户 占 据 多 数 ,而 到 了 年 底 消极 态度 的 推 文 数量 占 比 有 
较 大 的 提升 。2017 年 11 月 份 ,国外 媒体 开始 担忧 斯 里 
兰 卡 .巴基斯坦 等 国家 ,他 们 认为 “一 带 一 路 ”上 的 中 
国资 本 过 多 引进 到 本 国 , 过 度 经 济 依赖 导致 失去 本 国 
决定 权 。“ “一 带 一 路 ' 与 外 交战 略 " 主 题 的 情感 值 中 ， 
中 立 态 度 持 主流 ,最 多 的 时 候 达 到 了 70% 以 上 ,可 能 
是 多 数 用 户 宣传 了 中 国 与 多 数 国家 签署 了 协议 ,也 进 
行 了 外 交战 略 方面 事实 的 转载 ,较为 中 立 。“ “一 带 一 
路 "与 国内 热点 ”主题 下 包括 了 很 多 地 名 和 地 区 信息 ， 
该 主题 下 推 文 的 内 容 多 数 为 国内 某 个 地 区 在 “一 带 一 
路 "项目 中 取得 的 成 果 和 宣传 。 这 一 主题 下 的 积极 情感 
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值 在 5 月 份 后 占据 了 主流 ,消极 的 情感 占 比 较 低 且 波动 
较 小 ,中 文 用 户 对 “一 带 一 路 ”与 国内 发 展 较为 看 好 。 


“一 带 一 路 ”与 CPEC 


一 一 积极 到- 消极 玉 - 中 立 
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一 带 一 路 ”与 经 济 效应 


0.3 
0.2 EEC 
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一 六 积极 -可 消极 -中 立 
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C9 可 以 看 出 ,一带 一 路 "与 CPEC” 主题 的 中 巴 合 
众 河 | 起 了 国外 英文 推 文 用 户 的 兴趣 ,多 数 关注 中 巴 经 
江 生 记 的 经 济 效果 ,国内 外 对 CPEC 的 报道 比较 偏 乐 
观 稻 极 ,如 法 国 媒体 ”在 7 月 份 估算 CPEC 在 当地 创 
造 了 30 万 个 岗位 等 信息 。 该 主题 下 的 情感 波动 较 小 ， 
中 碰 占 多 数 ,10 月 份 后 积极 情感 值 有 整体 性 提升 。 
“ 安 带 一 路 ' 与 对 外 合作 ”主题 的 情感 波动 较 大 ,这 可 
能 时 5 月 份 峰会 后 中 国 和 其 他 国家 频繁 签署 协议 有 
关 5 载 至 7 月 份 总 共 与 61 个 国家 签署 了 2 431 份 合作 
协议 ,新 签 合同 额 714. 2 亿美 元 。7 月 份 起 吉 到 年 底 积 
极 的 情感 值 占 比 高 于 其 他 两 项 , 对 外 方 合作 方面 的 消 
极 情感 值 也 有 所 上 升 。“ “一 带 一 路 ' 与 经 济 效应 ” 主 
题 的 积极 情感 值 占 比 在 大 部 分 时 间 段 高 于 其 他 两 项 。 
据 商 务 部 网 站 的 介绍 ,2017 年 中 国企 业 共 对 “一 带 一 
路 "沿线 的 59 个 国家 非 金融 类 直接 投资 143.6 亿美 
元 ,英文 推 文 对 "一带 一 路 " 带 来 的 经 济 效应 逐渐 看 
好 。“ “一 带 一 路 "与 对 外 政策 ”主题 在 5 月 份 高 峰 论 
坛 后 积极 情感 逐步 上 升 ,高 峰 论坛 加 强 了 政策 沟通 和 
战略 对 接 , 签 署 了 多 个 双边 .多 边 合作 文件 及 企业 合作 
项 目 29 ,得 到 了 积极 的 反响 。 


= 
4 总 结 


2017 年 是 ”一带 一 路 "倡议 取得 突破 性 进展 的 一 


2017 年 英文 推 文 的 主题 及 其 情感 演化 结果 如 图 7 
所 示 : 
一 带 一 路 ”与 对 外 合作 


一 -积极 ”到 - 消极 一 -中 立 


1 月 2 月 3 月 4 月 5 月 6 月 7 月 8 月 9 月 10 月 11 月 12 月 


一 带 一 路 ”与 对 外 政策 


1 月 2 月 3 月 4 月 5 月 6 月 7 月 8 月 9 月 10 月 11 月 了 2 月 


一 积极 ~ 要- 消极 一 中 立 


图 7 英文 推 文 主题 在 不 同月 份 ( 模 轴 ) 的 情感 类 型 占 比 ( 纵 轴 ) 变化 


年 ， 一 带 一 路 "国际 合作 高 峰 论坛 召开 , 蒙 内 铁路 正 
式 通 车 、 亚 马尔 液化 天 然 气 项 目 首 条 生产 线 投产 等 很 
多 项 目 逐 步 落 地 ,新 的 合作 协议 不 断 签署 , “一 带 一 
路 ”一 词 成 为 全 世界 的 热 词 ,新 闻 报 道 更 多 的 是 从 官方 
的 角度 呈现 事实 ,而 国内 外 对 其 反响 难以 明确 ,世界 上 
众多 用 户 在 Twitter 上 对 “一 带 一 路 ”展开 热 议 ,从 中 更 
能 体现 用 户 的 关注 点 和 情感 倾向 。 基 于 LDA 的 Twit- 
ter 中 英文 文本 分 析 发 现 ,2017 年 中 文 推 文 热 议 有 六 大 
主题 ,分 别 为: “一带 一 路 ”与 朝鲜 半岛 和 平 问 题 “ 一 
带 一 路 ”与 经 济 问 题 “ 一 带 一 路 ”与 高 峰 论 坛 之 高 层 
访问 “一 带 一 路 ”与 高 峰 论 坛 之 合作 与 项 目 “ 一 带 一 
路 "与 外 交战 略 “ 一 带 一 路 ”与 国内 热点 。 英 文 推 文 
热 议 有 四 大 主题 ,分别 为 ;一带 一 路 "与 CPEC、“ 一 带 
一 路 "与 对 外 合作 “一带 一 路 ”与 经 济 效应 ”一带 一 
路 "与 对 外 政策 。 对 比 来 看 ,中 文 的 推 文 用户 关 注 的 问 
题 较 微观 ,对 ”一 带 一 路 "高 峰 论坛 热 议 很 高 ,更 凸显 
“合作 ”的 态度 ,以 “合作 ”为 出 发 点 看 待 “ 一 带 一 路 ”， 
看 重 “ 合 作 ” 的 过 程 。 英 文 推广 关注 的 主题 较 宏观 ,对 
整体 的 趋势 和 发 展 讨 论 更 多 ,更 多 从 “一 带 一 路 "倡议 
的 经 济 效应 和 发 展 情况 进行 评价 。 间 接地 反映 出 中 文 
推 文 将 "一 带 一 路 "倡议 定位 为 “区域 合 作 发 展 "项 目 ， 
而 英文 推 文 把 "一 带 一 路 "倡议 视 为 "经济 合作 "项目 。 

从 中 文 推 文 主题 的 情感 演化 模式 看 , 除 朝鲜 半岛 
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和 平 问 题 外 ,其 他 主题 的 积极 和 中 立 情感 均 占 主流 , 消 

极 情感 占 比 最 少 , 且 中 立 情 感 自 5 月 份 高 峰 论坛 后 均 

表现 出 下 降 趋 势 , 用 户 的 情感 倾向 更 明确 。 英 文 推 文 

的 积极 、 中 立 的 情感 值 也 占据 了 主要 位 置 , 除 “一 带 一 

路 ”与 外 交 政 策 外 ,其 他 主题 情感 波动 较 小 ,波动 点 主 

要 出 现在 10 月 份 附近 ,可 见 十 九 大 等 10 月 份 重要 的 

节点 事件 对 情感 影响 较 大 。 本 文通 过 主题 挖掘 和 情感 

分 析 方 法 ,尝试 呈现 国际 社交 媒体 对 “一 带 一 路 ”倡议 

的 关注 内 容 和 情感 倾向 。 在 未 来 还 需要 拓展 到 西班牙 

文 .法文 等 多 语种 的 推 文 ,更 全 面 地 呈现 国际 上 对 “一 

带 一 路 "倡议 的 响应 态度 和 关注 重点 。 
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Twitter Text Topic Mining and Sentiment Analysis Under the Belt and Road Initiative 
Zhao Changyu Wu Yaping” Wang Jimin: 
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= Abstract: | Purpose/significance | The Belt and Road Initiative has attracted widespread attention around the 


wotld , and users in many countries have expressed their opinions, comments and discussed with each other on twitter, the 


Srepresentative social media. The discussion topic and emotional tendency of “the Belt And Road” in the world ex- 


Cc 


bstld from the tweets will be helpful for the government to optimize their propaganda strategies and increase the exposure 
a httention of the Belt and Road Initiative. [ Method/process | This paper collected more than 60 000 tweets related to 
the Belt and Road Initiative in 2017, and respectively carried out data preprocessing, data description, topic mining, and 
sentiment analysis in Chinese and English, and realized cross-analysis of topics and emotions to draw conclusions. [ Re- 
siltZconclusion ] The tweet theme in 2017 is mainly around the “ Belt and Road Forum for International Cooperation”. 
CHimese tweets pay more attention to the planning and implementation of the forum, as well as security issues, visits by the 
leadership ，etc. The emotional value fluctuates greatly, especially the negative emotions on security issues. English tweets 
ar€ more concerned with the facts of holding the summit forum and the economic effects brought by the forum. The emo- 
tional fluctuations are small, and the emotional value of the economic aspect is that the positive proportion is significantly 
higher than the negative and neutral emotional values. 


Keywords: the Belt and Road Initiative twitter topic mining sentiment analysis 
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《图 书 情报 工作 》 入 选 “ 庆 祝 中 华人 民 共 和 国 成 立 70 周年 精品 期 刊 展 ” : 


2019 年 8 月 21-25 日 ,由 中 共 中 央 宣 传 部 ,北京 市 人 民政 府 主 办 ,中 国 图 书 进 出 口 (集团 ) 总 公司 承办 的 第 二 
十 六 届 北 京 国际 图 书 博 览 会 在 中 国 国际 展览 中 心 新 馆 ( 顺 义 ) 举 行 。《 图 书 情报 工作 》 人 选 “ 庆 祝 中 华人 民 共 和 国 
成 立 70 周年 精品 期 刊 展 ” ,作为 优秀 期 刊 之 一 在 图 书 博览 会 上 展 出 。 

为 了 向 伟大 祖国 70 华诞 献礼 ,回顾 并 致敬 中 国 期 刊 光辉 历程 ,中 国 期 刊 协会 联合 相关 单位 主办 了 ”庆祝 中 华 
人 民 共 和 国 成 立 70 周年 精品 期 刊 展 ”, 作 为 第 二 十 六 届 北 京 国际 图 书 博览 会 上 的 主要 主题 展览 内 容 , 在 展 出 中 占 
据 了 面积 最 大 的 主要 展位 。“ 庆 祝 中 华人 民 共 和 国 成 立 70 we 分 别 是 “新 中 国 获奖 期 
刊 ”期 刊 主题 宣传 好 文章 “致敬 创刊 70 周年 “中 国 期 刊 记忆 ” ,共计 展 出 1099 种 期 刊 。 展 览 全 面 展 示 了 新 中 国 
成 立 以 来 ,尤其 是 改革 开放 以 来 我 国 期 刊 业 取得 的 重要 成 就 ,同时 展望 了 新 时 代 期 ees 展 前 景 。 
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